導讀:Mozilla希望讓初創(chuàng)公司,研究人員和業(yè)余愛好者更容易構建支持語音的應用,服務和設備。為此,它今天發(fā)布了最新版本的Common Voice,這是一個開源的語音數(shù)據(jù)集,現(xiàn)在包括來自42000名貢
發(fā)表日期:2019-09-02
文章編輯:興田科技
瀏覽次數(shù):10103
標簽:
Mozilla希望讓初創(chuàng)公司,研究人員和業(yè)余愛好者更容易構建支持語音的應用,服務和設備。為此,它今天發(fā)布了最新版本的Common Voice,這是一個開源的語音數(shù)據(jù)集,現(xiàn)在包括來自42000名貢獻者超過1400小時的語音樣本,涵蓋18種語言,包括包括英語、法語、德語、荷蘭語、Hakha Chin語、世界語、波斯語、巴斯克語、西班牙語、中文、威爾士語和卡布語。
Mozilla聲稱,它是同類語言中最大的多語言數(shù)據(jù)集之一,比8個月前公開的普通語音語料庫要大得多,其中包含了2萬名英語志愿者500小時,40萬份錄音,而且語料庫很快就會擴大。該組織表示,70種語言的數(shù)據(jù)收集工作正在通過通用語音 網(wǎng)站 和移動應用程序積極開展。
通用語音可以集成到Deepspeech中,這是一套由Mozilla的機器學習小組維護的開源的語音到文本、文本到語音引擎和經(jīng)過培訓的模型,它不僅包含語音片段,還包含一些自愿者提供的元數(shù)據(jù),這些元數(shù)據(jù)可用于培訓語音引擎,如演講者的年齡、性別等等。
為了簡化流程,Mozilla本周推出了一款改進的Common Voice網(wǎng)絡工具,可以根據(jù)不同的提示進行剪輯,還提供了用于查看、重新錄制和跳過剪輯的新控件。此外,它還推出了新的配置文件功能,允許用戶跨語言跟蹤進度和指標,并添加人口統(tǒng)計信息。Mozilla表示,在接下來的幾個月里,它將嘗試不同的方法來通過社區(qū)努力和新的合作伙伴關系,增加數(shù)據(jù)的數(shù)量和質(zhì)量。最終目標旨在為那些尋求構建和使用語音技術的人提供更多更好的語音數(shù)據(jù)。
【來源:cnBeta.COM】
更多新聞
2020
從抄襲iPhone到亞洲第二!國內(nèi)手機巨頭加速了出海之旅,去了六個歐洲國家10月底,vivo召開在線會議,會上vivo正式進入了波蘭、德國、法國、西班牙、意大利、英國六個歐洲國家。同
View details
2020
優(yōu)酷前總裁完全是“栽贓”:受賄855萬,被判7年!優(yōu)酷原總裁被判7年,受賄855萬11月9日消息,優(yōu)酷網(wǎng)前總裁楊偉東被判受賄。2018年12月4日,阿里娛樂集團發(fā)布消息。報道稱,大佑谷商業(yè)
View details
2020
山寨廠商賣!Mate40混搭驍龍865,星環(huán)五的價格只有三位數(shù)截至目前,華為Mate40系列和iPhone 12系列旗艦已經(jīng)上市。因為這兩個系列的高端機器太受歡迎了,所以它們在上市后不久就
View details
2020
跑分超90萬!華為Mate40Pro+獲頂級認證,2項技術世界第一 不負旗艦之名,華為新旗艦Mate40系列,在各方面的表現(xiàn)都令人驚訝。例如,華為Mate40 Pro不僅拿
View details